آزمایش هایی درباره تأثیر تحلیل گفتمان بر الگوریتم های رده بندی و بازیابی اطلاعات

نویسندگان

جی. موراتو

کارشناس ارشد ادیان و عرفان دانشگاه تهران جی. لورنس

کارشناس ارشد ادیان و عرفان دانشگاه تهران ج..جنوا

کارشناس ارشد ادیان و عرفان دانشگاه تهران جی. ا.موریرو

کارشناس ارشد ادیان و عرفان دانشگاه تهران

چکیده

پژوهشگران نظام های نمایه سازی و بازیابی، به منظور بهبود نتایج [جستجو]، همواره از گنجاندن اطلاعات بافتاری بیشتر، پشتیبانی کرده اند. افزایش شمار پایگاه های اطلاعاتی متن کامل و پیشرفت های به دست آمده در ظرفیت ذخیره سازی رایانه ای، تحلیل متن را با بهره گیری از دانش زبان شناسی و فرا- زبان شناسی امکان پذیر ساخته است. از میانه دهه 1980، پژوهشگران توجه و گرایش بیشتری به بافتار پیدا کرده اند، و تحلیل گفتمان نقش مهم تری یافته است. هدف پژوهش توصیف شده در این مقاله، بررسی این مسئله است که آیا متغیرهای گفتمان، بر الگوریتم های نوین بازیابی و رده بندی اطلاعات اثر می گذارند یا نه. به منظور ارزیابی این فرضیه، چارچوبی عملی برای تحلیل اطلاعات در محیطی خودکار پیشنهاد شده است. در این محیط، ان ـ گرام ها[4] (فیلترکردن) و کی ـ مینز (میانگین عددkا) و الگوریتم های رده بندی و چن با زیرمجموعه هایی از مدارک، برپایه متغیرهای گفتمانی «گونه»، «سیاق»، «اصطلاح شناسی حوزه» و «ساختار مدرک» مورد آزمون قرار گرفتند. نتایج حاصل از مطالعه الگوریتم های زیرمجموعه های مختلف، با ساختار اطلاعات « سرعنوان های موضوعی پزشکی» (مِش) مقایسه شد. این نتایج نشان می دهد که ان ـ گرام ها وابستگی واضحی به متغیرهای گفتمان ندارند؛ هرچند که الگوریتم رده بندی کی ـ مینز چنین وابستگی را، البته فقط در «اصطلاح شناسی حوزه» و «ساختار مدرک» نشان می دهد، و سرانجام این که «الگوریتم چن» وابستگی مشخصی به همه متغیرهای گفتمان دارد. از این اطلاعات می توان برای طراحی بهتر الگوریتم های رده بندی که باید متغیرهای گفتمان را مورد توجه قرار دهند، استفاده کرد. نتایج فرعی دیگری نیز از این پژوهش حاصل شده است که در مقاله ارائه می گردد.

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پژوهش درباره اینترنت و بازیابی اطلاعات

متن کامل

الگوریتم بازیابی و رتبه بندی اطلاعات در موتور جستجوی گوگل

متن کامل

تحلیل پاسخ های آمیخته گسسته و پیوسته رده بندی شده

در این مقاله، هدف ما رده‌بندی پاسخ‌هایی است که به‌صورت آمیخته‌ای از پاسخ‌های گسسته و پیوسته هستند. برای اینکار، ابتدا باید تابع توزیع توأم چنین پاسخ‌هایی را داشته باشیم. بنابراین، مدل مکانی عام جدید را برای دستیابی به تابع توزیع توأم پاسخ‌های آمیخته‌ی گسسته و پیوسته معرفی کردهایم و بهصورت اجمالی با مدل مکانی عام دِ لئون و کریر [1] مورد مقایسه قرار داده‌ایم. رویکرد مورد استفاده برای رده‌بندی ...

متن کامل

تأثیر القای هیجانی بر بازیابی اطلاعات

هدف: بررسی نقش القای هیجانی کاربران در بازیابی اطلاعات. روش/ رویکرد پژوهش: روش مورد استفاده، آزمایشی و از نظر هدف کاربردی محسوب می‌شود. جامعه آماری این پژوهش را دانشجویان کارشناسی ارشد رشته‌های علوم انسانی دانشگاه بین‌المللی امام رضا (ع) تشکیل می‌دادند که نمونه‌ای شامل 42 نفر در دو گروه انتخاب گردید. اطلاعات لازم از طریق ابزارهای متعددی همانند پرسشنامه اطلاعات جمعیت‌شناختی و سابقه کار با اینترن...

متن کامل

مروری بر رده بندی نظری و رده بندی عملی

طرحهای رده بندی را میتوان به دو دسته نظری و عملی تقسیم کرد. مهمترین ویژگی رده بندی عملی(رده بندی کتابخانه ای و رده بندی کتابشناسی)پیوند آن با طبقه بندی علوم است . میزان وابستگی و انطباق رده بندیهای عملی و نظری مسئله اساسی مورد بحث در این مقاله است. به منظور حفظ توالی منطقی و پیوستگی مطلوب موضوعها و دوام و پایداری رده بندی در کتابخانه ها باید نظم علمی اساس تنظیم کتب قرار گیرد‘اما در انطباق رده ب...

متن کامل

الگوریتم بازیابی و رتبه‌بندی اطلاعات در موتور جستجوی گوگل

هدف اساسی این مقاله، تبیین نحوه عمل موتور جستجوی گوگل در رتبه‌بندی اطلاعات بازیابی شده است و بدین منظور، الگوریتم (خوارزمی) موتور جستجوی گوگل را در بازیابی و رتبه‌بندی اطلاعات بررسی می‌کند. در بخش اول – که text matching نامیده می‌شود – شیوه یافتن اطلاعات مرتبط با واژه‌های واردشده در جعبه جستجو، به‌طور خلاصه بیان می‌گردد و در بخش دوم – که بخش اصلی مقاله است و PageRank نام دارد – شیوه رتبه‌بندی ن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

عنوان ژورنال:

پژوهشنامه پردازش و مدیریت اطلاعات

جلد ۲۰، شماره ۱، صفحات ۶۷-۹۵

کلمات کلیدی

الگوی گفتمان تحلیل بافتار زبان شناسی رایانه ای روش های تحلیل متن فیلترکردن ان –گرام ها کی – مینز هم عبارت سازی[9]

میزبانی شده توسط پلتفرم ابری doprax.com